import PyPDF2
#没法读取扫描版pdf



if __name__ == '__main__':
    # 使用open的‘rb’方法打开pdf文件，使用二进制模式
    mypdf=open("C:\\Users\\11578\\Desktop\\shibei (2)\\文件\\tempFile.pdf", mode='rb')

    # 调用PdfFileReader函数
    pdf_document=PyPDF2.PdfFileReader(mypdf)

    # 使用PdfFileReader对象的变量，获取各个信息，如numPages属性获取PDF文档的页数
    print(pdf_document.numPages)


    # 调用PdfFileReader对象的getPage()方法，传入页码，取得Page对象：输出PDF文档的第一页内容
    first_page=pdf_document.getPage(0)


    # 调用Page对象的extractText()方法，返回该页文本的字符串
    text1=first_page.extractText()
    print(text1)
